O algoritmo de Tomasulo é um esquema que permite a execução de instruções em paralelo através do gerenciamento dos conflitos de dados que podem ocorrer. Desenvolvido na unidade de ponto flutuante IBM 360/91 esse esquema introduz a renomeação de registradores, com o objetivo de minimizar os conflitos WAW e WAR, e verifica a disponibilidade de operandos para evitar conflitos RAW.

O Common Data Bus (CDB) conecta estações de reserva diretamente a unidades funcionais. As unidades funcionais podem acessar o resultado de qualquer operação sem envolver um registro de ponto flutuante, permitindo que várias unidades aguardando um resultado continuem sem aguardar para resolver a contenção para acessar as portas de leitura do arquivo de registro. Detecção de Perigo e execução de controle são distribuídos. As estações de reserva controlam quando uma instrução pode ser executada, em vez de uma única unidade de perigo dedicada.

As instruções são emitidas sequencialmente para que os efeitos de uma sequência de instruções, como exceções levantadas por essas instruções, ocorram na mesma ordem em que seriam feitos em um processador em ordem, independentemente do fato de estarem sendo executados fora de ordem (ou seja, não sequencialmente).

O esquema de Tomasulo combina a renomeação de registradores e a "buferização" dos operandos de origem com as estações de reserva. Isso permite a eliminação de paradas devido a conflitos WAW e WAR. Os conflitos RAW são evitados com o atraso da execução de instruções que não estejam com seus operandos disponíveis. Uma outra vantagem desse esquema é a distribuição da lógica de detecção de conflitos e do controle de execução, pois quando os operandos se tornam disponíveis, múltiplas instruções podem ser emitidos simultaneamente. Isso porque os resultados são disponibilizados para todas as estações de reserva ao mesmo tempo, diretamente das unidades funcionais. A maior desvantagem desta abordagem é a complexidade do algoritmo de Tomasulo que requer uma grande quantidade de hardware. Além disso, a performance também é limitada pela presença de um único CDB, pois ele precisa interagir com todo o hardware do pipeline.

 $\frac{http://www.ic.unicamp.br/\sim rodolfo/Cursos/mo401/2s2005/Trabalho/049239-tomasulo.pdf}{}$ 

https://en.wikipedia.org/wiki/Tomasulo\_algorithm